1 贝 叶 斯 混合 效应 模型 基于 brms 的 应 用 教程 


2 潘 晚 坷 ! 温 秀娟 ” 金海 洋 ” 

3 (南京 师范 大 学 心理 学 院 , 南京 210097; “广州 医科 大 学 附属 脑 科 医院 , 广州 510370; ?Department of 

4 Psychology, Division of Science, New York University Abu Dhabi, PO Box 129188, Saadiyat Island, Abu 

5 Dhabi, United Arab Emirates) 

6 通信 作者 : 金海 洋 , E-mail: haiyang.jin 9 outlook.com 

7 

8 d 要 : 相 比 于 传统 方法 ， 贝 叶 斯 混合 效应 模型 在 处 理 数据 层级 结构 和 提供 更 直观 的 统计 结果 等 方面 有 
9S ”着 独 特 的 优势 。 这 些 诸多 优势 使 其 逐渐 流行 于 心理 学 研究 之 中 。 然 而 ， 国 内 目前 尚 缺 少将 贝 叶 斯 混合 

10 ”效应 模型 应 用 于 心理 学 研究 的 介绍 。 因 此 ， 本 文 首先 概述 了 贝 叶 斯 混合 效应 模型 的 基本 概念 和 原理 ， 

11 ”并 且 结 合 模 拟 数据 展示 了 如 何 理 解 固定 效应 和 随机 效应 ， 如 何 利用 R 语言 的 brms 工具 包 设 定 和 拟 合 贝 

12 ” 叶 斯 混合 效应 模型 ， 如 何 借 助 先 验 预 测 检验 自 定义 的 先 验 分 布 是否 合 理 ， 以 及 如 何 使 用 贝 叶 斯 因子 进 

13 ， 行 假设 检验 。 和 凭借 其 强大 的 灵活 性 ， 贝 叶 斯 混合 效应 模型 可 以 适用 于 多 样 的 心理 学 研究 。 

14 ”关键 词 : 贝 叶 斯 ， 混 合 效应 模型 ， 分 层 模 型 ， 贝 叶 斯 因子 ，brms 

15 

16 1 引言 

17 近年 来 ， 心 理学 研究 所 使 用 的 统计 方法 日 渐 丰 富 。 随 着 新 的 统计 方法 的 推广 与 普及 ， 心 理学 研究 

18 ”者 逐渐 意识 到 了 一 些 传统 统计 方法 的 局 限 性 。 作 为 实验 心理 学 最 常用 的 统计 方法 之 一 ， 重 复 测量 方差 
— 19 分 析 (Repeated-measures analysis of variance) 也 不 例外 。 首 先 ， 重 复 测量 方差 分 析 处 理 的 是 汇总 后 

20 (aggregated) 的 数据 ， 比 如 每 个 被 试 在 每 个 条 件 下 的 平均 反应 时 。 而 汇总 后 的 数据 忽略 了 每 个 被 试 个 

21 ”体内 部 的 变异 (variability〉， 这 可 能 会 导致 重复 测量 方差 分 析 无 法 对 自 变 量 的 效应 进行 准确 的 估计 

22 (Haaf & Rouder, 2017; Veenman et al., 2022) 。 其 次 ， 重 复 测量 方差 分 析 通 常 只 能 考虑 一 个 随机 因 

23 ” 素 (random factor, Judd etal., 2017) ， 而 无 法 同时 考虑 多 个 随机 因素 。 例 如 ， 重 复 测量 方差 分 析 一 般 

24 ”把 被 试 作为 随机 因素 ， 借 此 通过 被 试 样本 的 数据 推断 被 试 总 体 的 效应 。 类 似 的 ， 重 复 测 量 方差 分 析 也 

25 ”可 以 把 刺激 材料 作为 随机 因素 ， 通 过 实验 中 使 用 的 刺激 材料 推断 刺激 材料 总 体 的 效应 。 但 重复 测量 方 

26 ”差分 析 无 法 同时 考虑 被 试 和 刺激 材料 这 两 个 随机 因素 。 此 外 ， 当 某 个 被 试 在 茶 个 条 件 下 的 汇总 数据 缺 

27 ” 失 时 《例如 在 纵向 研究 中 某 些 被 试 未 能 参加 某 个 时 间 点 的 测试 ) ， 重 复 测量 方差 分 析 通 常 只 能 删除 存 

28 ”在 缺失 值 的 被 试 的 所 有 数据 ， 这 会 造成 数据 进一步 的 流失 从 而 可 能 导致 有 偏差 的 估计 (Magezi，2015; 

29 Matuschek etal., 2017) 。 


30 相 比 之 下 ， 线 性 混合 效应 模型 (Linear Mixed-effects Models, LMM) ， 亦 称 多 水 平 模型 
31 (Multilevel Models) 或 层级 模型 (Hierarchical Models) ， 可 以 更 好 地 处 理 这 些 问题 。 混 合 效应 模型 可 
32 ”以 考虑 被 试 在 各 个 条 件 内 的 变化 性 ， 数 据 中 可 能 存在 的 相互 依存 关系 和 层级 结构 ， 并 且 能 够 更 好 地 处 
33 ” 理 数据 缺失 等 问题 (Singmann & Kellen, 2019; Tuerlinckx et al., 2006) 。 例 如 ， 在 以 学 生 为 被 试 的 实 
34 ” 验 中 ， 学 生来 自 于 不 同 的 班级 ， 不 同 的 班级 属于 不 同 的 学 校 ， 同 一 个 班级 或 同一 个 学 校 的 学 生 的 表现 
35 ”一 般 更 相似 。 混 合 效 应 模型 可 以 更 好 地 考虑 学 生 、 班 级 和 学 校 之 间 的 层级 关系 ， 对 实验 效应 进行 更 准 
36 ” 确 的 估计 。 随 着 统计 工具 比如 R 语言 ) 的 成 熟 ， 在 心理 学 研究 中 使 用 混合 效应 模型 来 分 析 数 据 变 得 
37 ”更 加 容易 ， 越 来 越 多 的 研究 也 开始 使 用 该 模型 (Bono et al.，2021) 。 

38 与 (频率 论 的 ，Frequentist) 线性 混合 效应 模型 相 比 ， 贝 叶 斯 线性 混合 效应 模型 (Bayesian Linear 
39 ”Mixed-effects Models, BLMMO 因 其 在 基于 贝 叶 斯 统计 推断 《〈 即 依照 贝 叶 斯 定理 ， 通 过 结合 先 验 信息 
40 (prior) 与 模型 似 然 性 〈likelihood) 对 参数 的 后 验 (posterior) PETZ HEMT, PERL RIC 2.3) 以 及 处 
41 ， 理 复杂 模型 等 方面 的 优势 受到 了 越 来 越 多 研究 者 的 关注 〈Biirkner，2017; Sorensen & Vasishth, 2016) 。 
42 ”首先 ， 与 频率 论 统计 相 比 ， 贝 叶 斯 分 析 的 一 大 优势 是 可 以 量化 参数 估计 的 不 确定 性 (uncertainty〉， 即 
43 ” 贝 叶 斯 分 析 的 结果 是 一 个 分 布 〈 例 如 后 验 概率 密度 分 布 ， 详 见 2.2) ， 分 布 的 宽 窗 描述 了 对 参数 分 析 的 
44 ”不 确定 性 。 其 次 ， 贝 叶 斯 分 析 的 可 信和 区间 (credible interval〉 可 以 被 理解 为 一 个 拥有 一 定 概率 包含 真 值 
45 (true value) 的 区 间 。 比 如 95% 的 可 信 区 间 有 95% 的 可 能 性 包含 真 值 (Moreyetal.，2016) 。 但 该 理解 
46 ”通常 被 误 认 为 是 频率 论 置 信 区 间 (confidence interval) 的 属性 (Morey et al., 2016) (95% 和 置信 区 间 表 
AT ” 示 ， 在 通过 无 数 样本 所 获得 的 无 数 个 区 间 中 ， 大 约 有 95% 的 区 间 包 含 了 真 值 (Lambert，2018) ) 。 其 
48 ”次 ， 基 于 频率 论 的 统计 方法 一 般 不 能 为 支持 虚无 假设 (null hypothesis〉 提 供 证 据 (Cohen, 1994) ， 而 
49 “这些 潜在 的 证 据 可 以 通过 贝 叶 斯 分 析 中 的 贝 叶 斯 因子 〈Bayes Factor, BF) 或 实际 等 价 区 域 (Region of 
50 Practical Equivalence, ROPE) 获得 (Makowski etal., 2019) 。 再 者 ， 当 混合 效应 模型 试图 包含 复杂 的 
51 ， 随机 效应 结构 时 ， 基 于 频率 论 的 模型 通常 难以 收敛 Cconverge) ， 进 而 无 法 给 出 可 靠 的 估计 
52 (Matuschek et al., 2017) 。 相 比 之 下 ， 贝 叶 斯 模型 能 够 更 好 地 处 理 复杂 的 随机 效应 结构 〈Sorensen & 
53  Vasishth, 2016) 。 最 后 ， 贝 叶 斯 分 析 还 可 以 通过 整合 研究 者 的 先 验 知识 (例如 研究 者 通过 以 往 文献 的 
54 ”结果 获得 的 先 验 知识 ) 提供 更 合理 的 参数 估计 。 

55 贝 叶 斯 混合 效应 模型 兼 具 〈 频 率 论 ) 混合 效应 模型 和 贝 叶 斯 分 析 的 优点 ， 是 心理 学 研究 中 极 具 洪 
56 ” 力 和 值得 推广 的 统计 方法 。 本 文 致力 于 向 读者 提供 一 个 相对 容易 理解 和 上 和 手 的 教程 。 首 先 ， 我 们 将 概 
57 ” 述 混合 效应 模型 和 贝 叶 斯 统计 的 基本 概念 与 原理 。 其 次 ， 借 助 模拟 数据 ， 展 示 如 何 使 用 统计 编程 语言 
58 ”R 的 brms 工具 包 来 进行 贝 叶 斯 混合 效应 模型 的 数据 分 析 。 最 后 ， 讨 论 贝 叶 斯 混合 效应 模型 在 心理 学 
59 ，” 究 中 的 拓展 应 用 和 一 些 常见 问题 。 
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61 2 dels 
62 1.1 混合 效应 模型 


63 混合 效应 模型 (Baayen et al., 2008) 是 一 般 线 性 模型 的 扩展 形式 ， 得 名 于 它 同时 包含 了 固定 效应 
64 (fixed effects) 和 随机 效应 (random effects) 。 固 定 效应 通常 是 研究 者 所 感 兴趣 的 效应 ， 即 自 变 量 在 
65 ”总 体 (population) 水平 的 效应 。 与 之 相对 的 ， 随 机 效应 是 自 变 量 在 随机 因素 《例如 被 试 或 刺激 材料 ) 
66 ”各 个 水 平 的 特有 效应 。 例 如 ， 在 探究 图 片 类 型 对 情绪 唤醒 的 影响 的 实验 中 ， 每 个 被 试 受到 图 片 类 型 的 
67 ”影响 可 能 并 不 完全 相同 。 其 中 ， 图 片 类 型 对 所 有 被 试 的 平均 影响 为 固定 效应 ， 而 每 个 被 试 受 到 图 片 类 
eg ”型 的 影响 与 平均 影响 的 差 值 为 随机 效应 。 
为 了 更 好 地 解释 固定 效应 与 随机 效应 ， 我 们 首先 回顾 最 基本 的 一 般 线性 模型 

Yj; —fotfiXi; tej 公式 1 
KB, Yu 是 因 变 量 ， 比 如 被 试 的 脑 电波 幅 〈 详 见 3 应 用 示例 ) ， 表 示 第 名 被 试 在 第 i 试 次 的 观 
测 数据 。Xij 为 自 变量 ， 表 示 研 究 者 感 兴趣 的 实验 操作 ， 可 以 是 组 间或 者 组 内 变量 。 参 数 Bo 是 截 距 ， 
表示 所 有 被 试 的 均值 ， 比 如 所 有 被 试 的 平均 脑 电波 幅 ; 参数 By 为 斜率 ， 表 示 自 变量 对 因 变 量 的 影响 ， 
比如 不 同 图 片 类 型 对 被 试 脑 电 波幅 的 影响 (本 文中 涉及 截 距 和 和 斜率 的 解释 仅 适 用 于 应 用 逐次 差分 对 比 
编码 (Successive Differences Contrast Coding, ， 即 本 文 所 使 用 的 编码 ) 且 只 有 两 个 水 平 的 自 变量 
76 (Venables & Ripley, 2002) 。 当 使 用 不 同 的 编码 时 ， 截 距 和 和 斜率 的 解释 也 会 有 所 不 同 ， 详 见 Schad 等 ， 
77 20200 。 最 后 ，eiy 为 残 差 (residual) ， 表 示 模 型 中 不 能 被 解释 的 部 分 。 
78 需要 注意 的 是 ， 使 用 一 般 线性 模型 需要 满足 残 差 独立 性 〈independence) 和 正 态 性 Cnormality) 的 
79 MM (assumption) ， 即 不 同 观测 数据 的 残 差 应 该 是 相互 独立 并 且 服从 正 态 分 布 。 然 而 ， 在 被 试 内 
80 ”实验 设计 中 ， 每 个 被 试 完成 不 同 图 片 类 型 的 多 个 试 次 ， 因 此 他 们 在 不 同 试 次 上 的 表现 并 不 是 完全 独立 
81 ”的 。 此 时 使 用 一 般 线性 模型 无 法 处 理 观测 数据 间 的 依存 性 。 此 外 ， 公 式 1 的 模型 没有 考虑 不 同 被 试 间 的 
82 ”个 体 差异 ， 比 如 ， 不 同 被 试 的 平均 脑 电波 幅 ( 即 每 个 被 试 的 截 距 〉 可 能 存在 差异 ， 而 忽略 这 些 差 异 可 
83 ”能 会 掩盖 图 片 类 型 的 真实 效应 。 为 了 更 好 地 考虑 这 些 方面 ， 可 以 在 公式 1 的 基础 上 增加 随机 截 距 : 


Yij = Poj + f1Xij teij IN 
Boj = Bo + Soj 


85 与 公式 1 相 比 ， 公 式 2 主要 区 分 了 固定 截 距 (Bo) 和 随机 截 距 (Soj) 。 其 中 ， 固 定 截 距 可 以 被 理 
86 ” 解 为 所 有 被 试 截 距 的 平均 值 ， 即 所 有 被 试 的 平均 脑 电 波幅 ， 而 随机 截 距 可 以 被 理解 为 每 个 被 试 的 截 距 
87 ”与 固定 截 距 的 差 值 ， 即 每 个 被 试 各 个 条 件 的 平均 脑 电波 幅 与 所 有 被 试 平均 脑 电 波幅 的 差 值 。 虽 然 加 入 
88 ”随机 截 距 可 以 考虑 到 各 被 试 平均 脑 电 波幅 的 差异 ， 但 仍然 没有 考虑 到 自 变量 对 因 变 量 的 影响 在 不 同 被 
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试 上 的 差异 。 比 如 ， 不 同 被 试 受到 图 片 类 型 的 影响 并 不 一 定 相 同 。 为 了 更 好 地 解释 自 变 量 的 影响 在 不 
同 被 试 间 的 差异 性 ， 可 以 进一步 在 混合 模型 中 加 入 随机 斜率 ; 
Yij =Boj;+PBjXij;t ej 


Boj = Bo + Soj 公式 3 
baj = 十 91) 
与 公式 2 相 比 ， 公 式 3 主要 区 分 了 固定 斜率 (61) 和 随机 斜率 Sp 。 其 中 ， 固 定 斜率 是 所 有 被 
试 斜 率 的 平均 值 ， 即 所 有 被 试 受 到 图 片 类 型 的 平均 影响 ， 随 机 和 斜率 是 每 个 被 试 和 斜率 与 平均 斜率 的 差 值 ， 


即 每 个 被 试 受到 图 片 类 型 的 特有 影响 。 需 要 注意 的 是 ， 由 于 随机 截 距 与 随机 和 斜率 都 受到 同一 个 随机 因 
素 〈 被 试 ) 的 影响 ， 因 此 两 者 可 能 存在 一 定 的 相关 性 ， 比 如 对 于 平均 脑 电 波幅 (随机 截 距 ) 更 高 的 被 
试 ， 其 在 不 同 图 片 类 型 下 的 脑 电 波幅 的 差异 (随机 斜率 〉 可 能 更 大 。 此 时 通过 预 设 两 种 随机 效应 来 自 
同一 个 多 元 正 态 分 布 可 以 更 好 地 考虑 他 们 之 间 的 相关 性 。 

总 的 来 说 ， 混 合 效应 模型 是 一 般 线 性 模型 的 扩展 ， 它 能 够 借助 随机 截 距 和 随机 斜率 考虑 随机 因素 
(例如 被 试 和 实验 材料 〉 对 实验 效应 的 影响 ， 可 以 更 好 地 处 理 数据 中 的 依存 和 层级 关系 ， 弥 补 重复 测 
量 方差 分 析 的 不 足 ， 以 提高 对 于 实验 效应 估计 的 准确 性 。 


12 贝 叶 斯 混合 效应 模型 


在 构建 混合 效应 模型 过 程 中 ， 为 了 在 控制 合理 的 一 类 错误 率 的 同时 保持 良好 的 统计 效力 ， 研 究 者 
通常 需要 考虑 最 大 化 的 模型 (maximal model, Barr et al., 2013) ， 即 把 所 有 可 能 的 随机 截 距 、 随 机 和 斜 
率 和 它们 之 间 的 相关 系数 加 入 模型 中 。 然 而 ， 由 于 模型 参数 增多 ， 这 可 能 导致 模型 难以 收敛 ， 从 而 给 
出 不 可 靠 的 估计 (Bates et al., 2015) 。 相 比 之 下 ， 贝 叶 斯 混合 效应 模型 可 以 更 好 地 处 理 这 种 复杂 的 模 
型 。 更 重要 的 是 ， 相 较 于 频率 论 混合 效应 模型 ， 贝 叶 斯 混合 效应 模型 具有 考虑 先 验 信息 和 提供 更 直观 
的 参数 后 验 分 布 等 其 他 更 多 优势 。 这 些 优点 使 得 贝 叶 斯 混合 效应 模型 更 受 欢迎 。 

贝 叶 斯 定理 CBayes’ theorem) 在 贝 叶 斯 数据 分 析 中 起 着 重要 的 作用 ， 它 借助 数据 更 新 先 验 信息 ， 
从 而 得 到 后 验 信息 : 


p(Y|@) * p() 
pY) 
Eth, p(O|Y) 为 参数 的 后 验 分 布 (posterior distribution， 即 连续 型 参数 对 应 的 概率 密度 函数 或 离散 
型 参数 对 应 的 概率 质量 函数 ) ， 表 示 在 观测 到 数据 Y 的 基础 上 参数 9 的 概率 分 布 。 对 于 贝 叶 斯 混合 效 
应 模型 来 说 ，6 包 括 所 有 的 固定 效应 5、 随机 效应 9、 随 机 效应 间 的 相关 性 和 残 差 e〈 见 公式 3) 所 对 应 
的 分 布 的 所 有 参数 。p(9|Y) 可 以 由 公式 右 侧 部 分 计算 得 来 ， 其 中 p(9) 为 参数 的 先 验 分 布 〈prior 
distribution) ， 表 示 研 究 者 在 观测 到 数据 前 对 参数 9 的 先 验 知识 。p(Y|9) 为 似 然 〈likelihood) , HR 
了 当 参 数 0 为 不 同 的 值 时 ， 观 测 到 当前 数据 的 似 然 值 。 值 得 注意 的 是 ，p(Y) 并 不 包含 9， 这 是 因为 
p(7) 是 一 个 边际 似 然 Cmarginal likelihood) ， 它 是 通过 对 所 有 可 能 的 6 的 似 然 值 与 相应 的 先 验 概率 乘积 


p(8|Y) = 公式 4 
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求 和 或 积分 而 获得 〈 当 9 为 离散 变量 时 : p(Y) = ep (Y0) *p(0); 50 为 连续 变量 时 ，p(Y) = 
fap (Y19) *p(@)d@,  (Kruschke & Liddell, 2018) 。p(7) 是 一 个 “ 归 一 化 ”因子 (normalizing factor) ， 
能 够 确保 后 验 分 布 是 一 个 有 效 的 概率 分 布 〈 使 后 验 分 布 的 面积 为 1) 。 

基于 贝 叶 斯 定理 ， 在 对 贝 叶 斯 混合 效应 模型 进行 参数 估计 时 ， 研 究 者 首先 需要 为 各 参数 设置 合理 
的 先 验 分 布 ， 之 后 通过 数据 对 先 验 进 行 更 新 ， 从 而 获得 参数 的 后 验 分 布 。 需 要 注意 的 是 ， 随 着 模型 变 
得 复杂 ， 贝 叶 斯 定理 中 的 边际 似 然 〈 公 式 4 右 侧 分 母 部 分 ) 将 变 得 难以 计算 。 此 时 通常 通过 马尔 科 夫 链 
蒙特 卡 洛 (Markov Chain Monte Carlo, MCMC, Lambert, 2018; Morey et al., 2011) 算法 推测 参数 的 
后 验 分 布 (Biirkner, 2017) ， 其 具体 原理 可 参考 Plummer (2023) 。 与 MCMC 相关 的 重要 参数 会 在 下 
文中 结合 示例 予以 介绍 〈3.2 节 ) 。 


m 


3 应 用 示例 

我 们 将 借助 一 个 假想 的 心理 学 实验 展示 如 何 使 用 brms 工具 包 进 行 贝 叶 斯 混合 效应 模型 的 数据 分 析 。 
具体 来 说 ， 本 节 将 从 数据 模拟 和 预 处 理 、 模 型 的 构建 、 先 验 的 设 定 、 模 型 的 拟 合 与 检验 和 统计 推断 几 
个 方面 介绍 贝 叶 斯 分 析 最 基本 的 工作 流程 (Bayesian workflow, Gelman et al, 20200 。 具 体 代码 请 见 


https://osf.io/cgxwn/. 
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13 数据 模拟 与 预 处 理 


该 假想 有 


Ti 


究 的 目的 是 探究 抑郁 症 人 和 群 加 了 
者 和 40 名 健康 对 照 组 被 试 观看 30 张 积 极 和 30 张 ! 
感 兴 趣 的 因 变 量 是 晚期 正 电 位 Clate positive potentials, LPP) 的 波幅 。 


I 


组 depression. %{#82H control) x 2 (A 


中 组 别 为 被 试 间 因素 ， 图 片 类 型 为 被 试 内 因素 。 


片 类 型 type: 积极 positive、 


该 实验 为 2 组 别 group: 抑郁 


中 性 neutral) 混合 实验 设计 ， 其 


[不 同情 绪 刺 激 的 神经 基础 。 在 该 实验 中 ，40 名 抑郁 症 是 
性 图 片 ， 期 间 我 们 采集 了 他 们 的 脑 电 数据 。 


TIT 


E 


我 们 所 


该 假想 实验 的 数据 使 用 R 的 faux 工具 包 生 成 (DeBruine，2021) ， 具 体 代 码 请 见 补充 材料 数据 模 


拟 部 分 Chttps://osf.io/3g79b) 。 简 单 来 说 ， 我 们 设 定 ( 图 
片 诱发 的 LPP 比 中 性 图 片 高 6.5) ， 组 别 的 主 效应 为 0.1〈 即 控 M 


类 型 的 交互 作用 为 0.1。 


1 和 表 1) 


表 1 模拟 数据 表述 统计 结果 


组 别 图 片 类 型 
nmm 

由 郁 组 On-40 

i FREI 
PHERI 

裤 制 组 (n=40 

ane 积极 图 片 

YE: “总 体 参 数 ” 为 生成 模拟 数据 时 设 定 的 参 


ML 


先 ， 我 们 需要 确 
格式 的 数据 ， 即 每 一 和 
格式 的 数据 ， 即 每 一 


合 效应 分 析 。 与 大 部 分 实验 程序 〈 例 如 E-prime) 生成 的 数 
据 也 是 以 “长 ”格式 保存 ， 符 合 brms TAL AB 
可 以 通过 head(df. simu, 10) 查 看 前 10 行 数据 : 


head(df simu, 10) # 查看 数据 结构 
A tibble: 10 x 4 
subj group type 
sO depression netural 
2 SO depression netural 
3 fl depression netural 
4 s01 depression netural 
5 Oil depression netural 
6 s01 depression netural 


总 体 参 数 
(均值 ) 
-2.70 
3.83 
-2.55 
4.12 


图 片 类 型 的 主 效应 为 6.5〈 即 积极 图 
HI ZH LPP 比 抑郁 组 高 0.1) 和 组 别 与 图 片 


均值 标准 差 
-2.71 2.12 
3.78 2.56 
-243 1.97 
4.07 2.62 


数 ;， “均值 ”和 “标准 差 ” 为 模拟 数据 的 描述 性 统计 结果 。 


果 数 据 集 的 结构 符合 工 


\ 包 的 要 求 。 重 


的 brms 工具 包 需 要 使 月 


了 是 一 个 被 试 的 数据 。 相 比 之 下 ， 混 合 效应 模型 的 分 析 通 常 需要 
行 是 一 个 试 次 的 数据 。 例 如 ，R 语言 5 


TRE 

.64 
.00 
3/98] 
TAZ 
.34 
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E, RINE faux T. 
RMR. ARMA 


测量 方差 分 析 通 第 需要 “ 宽 ” 


EJER 


(wide) 


(long) 


长 数据 格式 进行 混 
LAL AE RAY BIA 
ERREN df simu, RAI 


## 7 s01 depression netural -3.46 
## 8 s01 depression netural 2 «, I9) 
## 9 s01 depression netural -3.27 
## 10 s01 depression netural -1.44 
此 外 ， 我 们 还 需要 对 数据 集 dí simu PARKA CA) 变量 Cnominal factors) 进行 编码 (contrast 
coding) 。 这 里 我 们 使 用 逐次 差分 对 比 编码 (Successive Differences Contrast Coding) 对 组 别 〈group ) 


和 图 片 类 型 (type) 这 两 个 自 变量 进行 编码 ， 即 使 用 及 中 的 MASS::contr.sdif() ER 
究 者 熟悉 的 主 效应 和 交互 作用 《〈 见 公 


斯 模型 的 输出 结果 刚好 对 应 大 部 分 下 


设 定 -0.5 和 0.5 的 编码 
contrasts (df simu$group) «- 


MASS: 


contrasts (df simuStype) «- MASS: 


1.4 构建 模型 


完成 数据 的 预 处 理 后 ， 研 究 者 需要 构建 模型 。 模 型 构建 主要 有 两 种 方法 。 
逐渐 添加 更 多 的 效应 以 寻找 能 够 最 优 地 解释 数据 的 模型 。 


最 感 兴趣 效应 的 简单 模型 开始 ， 
法 是 根据 实验 设计 构建 最 
知 和 心理 学 研究 者 所 采用 CSchad et al., 
(对 第 一 


大 化 的 模型 (Barr et al., 2013) 。 
2021) ， 本 文 将 主要 介绍 如 何 根据 实验 设计 构建 最 大 化 模型 
种 途径 感 兴趣 的 读者 可 参考 (Schad etal.，2021) 。 


函数 。 通 过 此 设 定 ， 贝 叶 
\ 式 1 处 解释 ) 。 


SEE s SielaLir (22) 
Comec cei (2) 


一 种 是 从 包含 了 研究 者 
另外 一 种 方 
鉴于 第 二 种 方法 相对 简单 ， 且 更 多 的 被 认 


在 实际 分 析 中 建立 贝 叶 斯 线性 
要 注意 的 是 ， 本 文 为 了 更 清晰 地 介 


昆 合 效应 模型 时 ， 下 


" 


究 者 可 以 直接 根据 实验 设计 设 定 最 大 化 的 模型 。 


召 如 何 理 解 和 设 定 固定 效应 和 随机 效应 ， 我 们 将 以 三 个 模型 为 例 ， 


分 别 解 释 如 何 结合 实验 设计 使 用 brms 设 定 固定 


我 们 首先 建立 一 个 仅 包含 固定 效应 的 模型 Gnodel 1) o 
j 作 为 固定 效应 。 


类 型 (nype) 两 个 自 变量 以 及 他 们 的 交互 作 
的 ， 且 图 片 类 型 对 于 每 个 被 试 的 影响 也 是 相同 的 。 


建立 只 有 固 


定 效应 的 模型 
<= leen 

WDS c Grow = CJE, 
data = 
chains = 4, 
warmup = 1000, 
iter = 5000, 
thin = 1, 


cores = 4 


SS 
4 
g 


model 1 


df simu, 


效应 、 随 机 截 距 和 随机 斜率 。 


具体 来 说 ， 我 们 将 组 别 (group) AIR 
该 模型 假定 所 有 被 试 的 平均 波幅 都 是 相同 
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E LIAS, LPP 为 因 变量 ， 
和 图 片 类 型 type 两 个 自 变量 的 主 效应 以 及 他 们 的 交互 作用 。df_simu 为 数据 集 。 


即 被 试 观看 不 同 图 


片 时 LPP 的 波幅 


» group 


* type 表示 组 别 group 
其 他 参数 是 模型 拟 合 时 


所 基于 的 MCMC 采样 算法 的 相关 参数 。 为 了 保证 后 验 分 布 的 有 效 性 ，MCMC 通常 会 同时 运行 多 个 独立 


的 采样 过 程 ， 每 个 独立 的 采 相 
CHES B30) » MCMC 获得 的 参数 后 验 分 布 才 更 可 
我 们 设置 了 4 条 链 (chains = 4， 默 认为 4) 。 
器 核心 (Central Processing Unit cores) 的 个 数 。 
分 别 各 运行 1 条 马尔 可 夫 链 〈 共 


使 用 的 计算 机 中 央 处 到 
使 用 4 个 中 央 处 理 器 核心 同时 4 


过 程 称 为 一 条 链 (chain) 。 


Akb AA 
HG AE 


只 有 当 各 个 独立 链 的 采 相 
4H 2X] CMcElreath, 2020) 。 
与 之 相对 应 的 是 cores 参数 ， 它 可 以 设 定 运行 MCMC 时 
WE cores=4 GRUN 1) 表示 
高 数据 分 析 的 速度 。 


4 条 链 ) ， 借 此 提 


和 “融合 ”在 一 


起 时 


在 model 1 中 ， 


iter BRE 〈iteration 的 简写 ) 指 的 是 每 条 链 的 迭代 次 数 ， 即 对 每 个 参数 进行 多 少 次 的 采样 〈sample) 。 


warmup 参数 (或 称 为 burn in) 设 定 了 在 每 条 链 采 样 的 开 


台阶 段 用 于 “校准 


采样 器 (sampler) 以 提升 采 


FENCE ATER RAL CEJL https://mc-stan.org/docs/reference-manual/hmc-algorithm-parameters.html) , i% 


阶段 的 采样 不 会 被 纳入 最 终 的 参数 概率 分 布 。 
示 每 隔 thin 个 采样 保留 一 个 样本 ， 套 


https://mc-stan.org/docs/reference-manual/effective-sample-size.html#thinning-samples ) 。 


链 最 后 保留 的 采样 数量 


Fe FY DAI 


a5 iter ~ warmup 和 thin FAK, 


如 ， 在 model 1 中 每 一 条 链 会 保留 每 个 参数 的 4000 个 样本 ， 即 (5000-1000) /1， 最 终 4 条 链 一 


留 16000 个 样本 。 


通过 summary() 函数 可 以 展示 模型 拟 合 的 相关 参数 和 结果 : 


summary (model 1) 


Data: df simu 


Family: gaussian 


Formula: LPP - group * type 


Population-Level Effects: 


可 以 查看 参数 情况 


Links: mu = identity; sigma = identity 


(Number of observations: 
Draws: 4 chains, each with iter - 5000; 


total post-warmup draws - 16000 


Estimate Esti Error 1—95% 
Intercept 0.68 0.04 0 
group2M1 0.28 Oss: 0 
type2M1 6.50 0.09 6 
group2M1:type2M1 0.02 (5.110 -0 
Family Specific Parameters: 


4800) 

warmup = 
CL 1895s 
JS 0. 
Salud OF 
233) 6. 
92 0. 


1000; thin 


CI Rhat Bulk ESS Tail | 


ma IOO 
45 1.00 
67 1.00 
35 1.00 


= 1; 


thin 参数 为 “稀释 比例 (thinning rate， 默 认为 1) ”， 
过 设 定 较 大 的 thin 来 减少 电脑 内 存 的 需求 〈 详 见 
总 的 来 说 ， 每 条 
最 后 保留 的 采样 数 等 于 Gier -warmup) /thin。 例 


ESS 


19010 12439 


ZILS 12581 


22435 1293 


20:523] ALIOS) 


会 保 


wp WN 
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Xiv: 


Draws were sampled using sampling (NUTS). 


and Tail ESS ar ffective sample size m 


Estimate nse Epor NI 9 E Gig ST IEEE KEESSSIINESS 


sigma 3.03 0.03 ZO SOS) 1.00) 20821 2097 


For each parameter, Bulk ESS 


asures, and Rhat is the potential 


Scale reduction factor on split chains (at convergence, Rhat - 1). 


输出 结果 的 第 一 部 分 展示 了 模型 设置 的 信息 。 例 如 ，“Family: gaussian, Links: mu = identity; 
sigma = identity” 表 示 模 型 预 设 自 变量 和 因 变 量 间 的 关系 是 线性 的 ， 且 残 差 是 一 个 正 态 分 布 。 对 于 其 他 
非 线 性 关系 的 模型 ， 研 究 者 可 以 设 定 相应 的 残 差分 布 和 链接 函数 《〈 详 见 第 4 部 分 ) 。 


Population-Level Effects 部 分 为 固定 效应 的 结果 ， 


模型 的 固定 截 距 ， 表 示 所 有 被 试 的 平均 LPP 波幅 。 


通常 是 研究 者 最 为 关注 的 部 分 。 其 中 ，Jniercepi 是 
group2M1 表示 在 平均 图 片 类 型 的 效应 之 后 ， 健 康 对 


照 组 的 LPP 波幅 减 去 抑郁 症 组 LPP 波幅 的 差 值 ， 即 组 别 的 主 效应 。 与 此 类 似 ，mype2M17 是 在 平均 组 别 


的 效应 之 后 ， 积 极 图 片 诱发 的 LPP 波幅 减 去 中 性 图 


片 诱发 的 LPP 波幅 的 差 值 ， 即 图 片 类 型 的 主 效 应 。 


group2M 1 :type2M 1 是 组 别 和 图 片 类 型 AS H, 作 用 , BI) (OPP pain cave: s LPP w — = 


(LP Pae T LPP aea, pet x): 


在 输出 的 结果 中 ，Estimate 表示 参数 的 后 验 分 布 的 均值 ，Esi.Error 表示 后 验 分 布 的 标准 差 


(standard deviation) . /-95% CI 和 wu-95% CI 表示 参数 的 95% 可 信 区 间 的 两 个 边界 ， 例 如 group2M1 的 


95% 的 可 信 区 间 是 [0.11，0.46]。Rhat 表 示 不 同 链条 采样 的 融合 程度 。Rhat 越 接近 于 1， 表 示 不 同 链条 采 


样 融 合 得 更 好 ， 即 模型 的 收敛 情况 更 好 。 如 果 Rhat 


模型 的 收敛 情况 并 不 理想 (Gelman & Rubin, 1992; 


大 于 1.1 (或 更 严格 的 标准 下 ， 如 大 于 1.01〉 则 说 明 
Vehtari et al., 2021) 。 此 时 ， 研 究 者 不 应 该 使 用 


获得 的 后 验 分 布 进行 进一步 的 分 析 ， 而 应 该 检查 模型 设 定 和 数据 是 否 存在 问题 ， 并 进行 相应 的 调整 。 
ESS 为 有 效 样本 量 (effective sample size) ， 是 对 MCMC 算法 采样 到 的 有 效 且 独立 的 样本 数量 的 估计 。 
ESS 越 高 表明 能 用 来 有 效 估 计 后 验 分 布 的 样本 数量 越 大 。 通 常 建议 Bulk-ESS 应 是 MCMC 链 数 量 的 100 
倍 及 其 以 上 。 例 如 ， 当 使 用 4 条 MCMC ER, Bulk-ESS 应 至 少 为 400 CVehtari et al., 2021) 。 为 了 以 
确保 足够 的 Bulk-E5S5， 研 究 者 可 以 适当 增加 irer， 例 如 本 文 使 用 的 iter 为 5000. Tail-ESS 表示 后 验 分 布 


两 端的 有 效 样本 量 。 通 常情 况 下 ， 过 小 的 Bulk-ESS 
和 先 验 分 布 一 般 可 以 解决 大 部 分 Rhat 过 大 的 情况 。 
的 融合 情况 : 


和 Tail-ESS 会 伴随 着 过 大 的 Rhat。 设 定 合理 的 模型 
最 后 ， 研 究 者 还 可 以 通过 可 视 化 的 方式 检查 各 条 链 
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图 1 model 1 的 MCMC 各 条 链 采 样 轨迹 图 〈 又 称 “ 毛 毛虫 "图 ) 
YE: x 轴 表示 迭代 数 ，y 轴 表 示 参 数值 。 不 同 颜 色 的 线 表 示 不 同 的 链 。 


图 2 


链 参 数 的 抽样 很 好 地 “融合 ”在 一 起 ， 


述 了 model_7 中 MCMC ^ [s] 


I 样 的 轨迹 图 ， 反 映 了 不 同 链 的 融合 情况 。 在 图 


1 
2 
3 
4 


1 中 ， 不 同 


说 明 其 对 应 的 参数 后 验 分 布 是 相对 可 靠 的。 由 


于 融合 的 链 看 起 


来 像 一 条 毛毛 虫 ， 因 此 图 1 的 轨迹 图 又 称 “毛毛 虫 ” 图 。 如 果 一 条 链 的 抽样 与 其 他 链 的 抽样 存在 一 定 的 


差异 (通常 也 会 伴随 着 较 大 的 Rhat) ， 


见 补充 材料 第 三 部 分 MCMC 链 不 收敛 示例 ， 


合理 


性 (Roy, 2020) 。 


那 这 些 后 验 寺 
https://osf.io/3g79b) ， 


I 样 也 很 可 能 无 法 有 效 地 表征 参数 的 后 验 分 布 〈 详 
此 时 ， 研 究 者 需要 重新 考虑 模型 的 


如 前 所 述 ， 仅 包含 固定 效应 的 模型 Gnodel 1) 假定 所 有 被 试 的 平均 脑 电 波幅 都 是 相同 的 ， 即 所 有 


被 试 共享 同一 个 截 


距 值 。 但 这 种 情况 在 现实 中 不 太 可 能 发 生 。 更 可 能 


4 情况 是 ， 每 个 被 试 


的 平均 脑 电 


波幅 都 各 不 相同 。 因 此 ， 我 们 需要 在 模型 中 增加 随机 截 距 来 考虑 被 试 在 平均 脑 电波 幅 上 的 个 体 差 异 。 


Soi) > Bh (J | subj). 

model 2 prm 
WBS c GOLD Ey es. 
data = 
chains = 4, 
warmup = 1000, 

5000, 


df simu, 


iter = 


(QE J| Swag) y 
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具体 来 说 ， 我 们 需要 在 model 1 的 基础 上 增加 基于 被 试 Chy-subject) 的 随机 截 距 〈 对 应 公式 2 中 的 
其 中 subj 为 被 斌 编号，/ 表示 随机 截 距 : 


10.00098v4 
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summary(model 2) + 查看 参数 情况 〈 部 分 输出 结果 ) 

Group-Level Effects: 
~subj (Number of levels: 80) 

MStumacesNStSETESOFNI.O5oSGIEuU-ObUECHE Ehate Bul SESS Tad TSS 
sd(Intercept) 2 ALS) gy 1.84 2 o5. Il (il 934 1946 
Population-Level Effects: 

Estimate Hist. bron 1-959 Cl u-95>5 Cl Rhat Bulk DSE Faull MSS 

Intercept OGT 0.24 (015 3E) dba db. Ib. 00) 502 1018 
group2M1 ORIG 0.49 =O, 72 JL.) 3b @il 450 1095 
type2M1 6.50 0.06 6.38 $92. 1. OO 13087 TOS 
group2M1:type2M1 0.02 0). 113 =0 523 O25 1.00 13188 10601 


Population-Level Effects 7j model 2 固定 效应 的 结果 ，] 


其 相关 参数 的 含义 与 model_] 中 的 相同 《〈 详 见 


32 B) o Group-Level Effects 为 随机 效应 结构 的 结果 ， 其 中 sd(Intercept) 为 随机 截 距 的 标准 差 ， 反 映 
了 LPP 平均 波幅 在 不 同 被 试 间 的 离散 程度 。 虽 然 model 2 


但 它 仍 然 假 定 所 有 被 试 受到 实验 处 理 〈 即 图 片 类 型 ) 的 


考虑 了 不 同 被 试 平 均 LPP 波幅 的 个 体 差异 ， 


影响 是 相同 的 。 然 而 在 实际 情况 中 ， 每 个 被 试 


受到 图 片 类 型 的 影响 更 可 能 是 不 同 的 。 因 此 ， 我 们 需要 设置 随机 斜率 考虑 图 片 类 型 对 不 同 被 试 的 不 同 
影响 。 具 体 来 说 ， 我 们 可 以 在 model 2 模型 的 基础 之 上 加 入 随机 斜率 〈 对 应 公式 3 中 的 Si ) ， 即 (type 
| subj), FEF subj 为 被 试 编号 ，type 为 图 片 类 型 的 随机 和 斜率。 与 此 同时 ， 我 们 也 在 模型 中 加 入 了 随机 截 


E 与 随机 斜率 间 的 相关 : 


model > <= brm 


H2S = Groo = cys ar (UL se eya | eme) 
data = df simu, 
chains - 4, 
warmup - 1000, 
iter - 5000, 
thin = 1, 
cores = 4 
) 
summary (model 3) 查看 参数 情况 (部 分 输出 结果 ) 
# Group-Level Effects: 
Ls ~subj (Number of levels: 80) 
# Estimate Est.Error 1-95% CTI u-95$ CT Rhat Bulk ESS Tail ESS 
# sd(Intercept) 2 ab y 0.18 1.86 2759 Al silo) AIL 2404 
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310 sd (type2M1) TBZ 0.16 iL; 216 1.00 2783 5543 
311 cor (Intercept, type2M1) 9.92 011 0.10 (05/2 1,00 i73 3516 
312 

313 Population-Level Effects: 

314 Estimate Est.Error 1-95$ CI u-95$ CI Rhat Bulk ESS Tail ESS 
315 Intercept 0.68 0.24 0.19 1.14 1.01 623 1239 
316 group2M1 (00827 0.47 -0.64 Loi Oi 630 1343 
317 type2M1 6.49 Ga 2il 6.08 6.90 1.00 1535 3228 
318 group2M1:type2M1 0.00 0.42 -0.84 0.84 1.00 1595 3085 
319 与 model 2 RIAH, model 3 中 的 Group-Level Effects 部 分 额外 展示 了 基于 被 试 的 随机 斜率 和 它 


320 ”与 随机 截 距 相关 性 的 后 验 分 布 情况 。 其 中 ，sd(ype2M17) 为 基于 被 试 的 图 片 类 型 随机 和 斜率 的 标准 差 ， 反 
321 ”上 映 了 不 同 被 试 LPP 波幅 受到 图 片 类 型 不 同 影响 的 离散 程度 。cor(Intercept, type2M 1). 为 随机 截 距 和 随机 


14 


y 
V 


Qu 


CO so 。 斜率 的 相关 ， 该 相关 结果 表明 两 者 之 间 存 在 一 定 的 下 相关， 即 平均 LPP 波幅 更 大 的 被 试 ， 其 对 积极 图 
© 323 。 片 的 LPP 波 幅 也 比 中 性 图 片 更 大 。 

加 xn 至 此 ， 我 们 完成 了 对 该 模拟 数据 的 最 大 化 模型 的 构建 ， 即 根据 实验 设计 设 定 了 所 有 合理 的 固定 
325 应 和 随机 效应 结构 。 在 该 示例 中 ， 我 们 从 仅 包含 固定 效应 的 线性 模型 出 发 ， 在 不 同 的 模型 中 依次 展示 
CN 326 。 了 如 何 深 加 随 机 截 下 和 随机 作 率 。 需 要 强调 的 是 ， 在 实际 的 贝 叶 其 数据 分 析 中 ， 研 究 者 可 以 根据 实验 
CÓ 327 。 设计 直接 设 定 最 大 化 的 本 型 ， 而 无 需 在 不 同 的 模型 中 依次 添加 不 同 的 随机 效应 。 


328 如 前 所 述 ， 贝 叶 斯 混合 效应 模型 还 可 以 同时 考虑 多 个 随机 因素 ， 以 及 不 同 随机 因素 间 的 层级 关系 。 
例如 ， 在 分 析 包 含 “ 学 生 -班级 -学 校 ” 层 级 关系 的 数据 时 ， 研 究 者 可 以 通过 设 定 “(1 | 学 校 \ 班 级 \ 学 
^E) ”的 随机 效应 结构 来 考虑 同一 个 班级 和 同一 个 学 校 学 生 间 的 相似 性 等 〈 详 见 ，Biirkner，2018) . 


15 先 验 的 设置 


332 完成 构建 模型 后 ， 研 究 者 需要 根据 当前 的 先 验 知识 自 定义 模型 的 先 验 ， 从 而 在 数据 分 析 中 整合 研 
333 ” 究 者 的 先 验 知识 ， 这 也 是 贝 叶 斯 分 析 的 一 大 优势 。 由 于 我 们 在 先前 建立 的 模型 (例如 model 3) 中 没有 
334 ” 自 定义 先 验 分 布 ， 因 此 这 些 模型 使 用 的 均 是 brms 预先 设 定 的 默认 先 验 分 布 。 这 些 先 验 分 布 通常 是 弱 信 
335 ” 息 先 验 (weakly informative prior) ， 即 相对 实验 数据 来 讲 ， 基 本 不 能 为 参数 估计 提供 有 效 信息 的 先 验 
336 (Seaman et al., 2012) 。 然 而 ， 使 用 这 些 默 认 的 弱 信 息 先 验 不 仅 不 能 发 挥 贝 叶 斯 数据 分 析 的 最 大 作用 ， 
337 ”甚至 可 能 会 对 数据 分 析 的 结果 产生 负面 的 影响 (Seaman et al., 2012) 。 例 如 ， 贝 叶 斯 因子 很 容易 受到 
338 ” 先 验 分 布 的 影响 ， 不 合理 的 先 验 会 导致 有 偏差 的 贝 叶 斯 因子 。 因 此 ， 为 贝 叶 斯 分 析 设 定 合理 的 先 验 至 
339 REH, 
340 作为 设 定 先 验 分 布 的 第 一 步 ， 研 究 者 需要 了 解 自 己 可 以 对 一 个 模型 的 哪些 参数 设置 先 验 。 这 里 可 
341 ”以 借助 get prior() 函数 得 到 相应 的 信息 : 
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get prior( 
TEE a GS OUS ~~ ee ap (il ap ee |) ewo, 
data = df simu 


studentie Or Wad, ne 


如 结果 所 示 ， 我 们 可 以 为 model 3 模型 的 以 下 参数 设 定 先 验 : 


seudentke O W, 3) sd 
studenter Wp, 5) sd subj 
Sieucemicgie (SiO), 5) sd Intercept subj 
studentie Wp 3) sd type2M1 subj 
studentke(O (yp. 5) sigma 


EERE 


PREGL class coef group resp dpar nlpar lb ub 
(flat) b 

(flat) b group2M1 

(Gellene)) b group2M1:type2M1 

(flat) b type2M1 

abies (ib) Cor 

abies (ib) COn subj 


E (class 为 Intercept? ; 固定 


斜率 (class 为 5p»)， 包 含 组 别 主 效应 、 图 片 类 型 主 效 应 和 他 们 的 交互 作用 
(分 别 对 应 coef A group2M1, type2M1 和 group2M1:type2M1) ; 基于 被 斌 (group X subj) 的 随机 效应 
的 标准 差 (class 为 sd) ， 包 含 随 机 截 距 (coef 为 Intercept ) 和 随机 斜率 (coef 为 type2M12 , FEF HR 
试 的 随机 效应 间 的 相关 (class X cor) ， 以 及 残 差 (class 为 sigma) o BF sd I sigma 不 能 为 负数 ， 因 


此 这 些 参 数 的 最 小 值 为 0〈 即 列 Ib, X low bound 的 缩写 ) o 


在 实际 数据 分 析 中 ， 研 究 者 一 般 可 以 根据 以 往 研 究 的 结果 为 当前 研究 的 模型 设 定 先 验 分 布 。 此 时 ， 


研究 者 可 以 通过 先 验 预测 检验 Cprior predictive check) 来 测试 这 些 先 验 的 合理 性 ， 并 进行 相应 的 调整 ， 
进而 为 模型 确定 合理 的 先 验 。 在 进行 先 验 预 测 检验 时 ， 需 要 考虑 领域 知识 Cdomain knowledge) ， 即 研 


究 者 对 研究 领域 的 专业 知识 和 经 验 ， 它 可 以 帮助 研究 者 确定 先 验 分 布 的 合理 范围 ， 并 检查 先 验 分 布 是 
人 否 与 领域 知识 一 致 。 如 果 先 验 分 布 与 领域 知识 相 了 矛盾 ， 则 需要 重新 考虑 2 


E 验 分 布 的 选择 。 


如 果 可 以 从 先前 类 似 的 研究 获得 参数 的 后 验 概 率 分 布 ， 研 究 者 可 以 将 这 些 概 率 分 布 作为 当前 研究 
模型 的 先 验 分 布 。 即 使 无 法 获得 参数 准确 的 概率 分 布 ， 研 究 者 仍然 可 以 根据 先前 研究 结果 以 及 自己 已 


时 ， 我 们 可 以 首先 尝试 设置 弱 信 息 的 先 验 分 布 : 


定义 先 验 分 布 


prior Oil <= el 


13 


有 的 知识 为 模型 设 定 先 验 分 布 。 假 设 我 们 无 法 从 先前 研究 中 获取 参数 的 概率 分 布 作为 模型 的 先 验 。 此 


376 prior(normal(0, 10), class = Intercept), 

377 prior(normal(0, 10), class - b), 

378 prior(normal(0, 5), class - sigma), 

379 erie (inemial (0, S), Glass = sel), 

380 IE (Likes) (2), Class = cox) 

381 ) 

382 在 上 述 代码 中 ， 我 们 把 固定 截 距 和 固定 斜率 分 别 设 定 为 一 个 均值 为 0， 标 准 差 为 10 的 正 态 分 布 


383 (在 代码 中 表示 为 normal(0, 10)) 。 对 于 prior(normal(0, 10), class = Intercept)， 我 们 可 以 简单 地 把 它 理 
384 RAN, 我们 设 定 所 有 被 试 的 平均 值 脑 电 波幅 大 臻 有 95% 的 概率 落 在 -20 和 20 之 间 即 两 个 标准 差 之 内 ) 。 
385 ”对 于 平均 脑 电 波幅 来 讲 ， 这 是 一 个 相对 比较 大 的 区 间 。 因 此 ， 它 对 应 的 先 验 分 布 是 弱 信 息 先 验 分 布 。 
386 ”类 似 地 ， 所 有 固定 斜率 ， 包 含 组 别 和 图 片 类 型 的 主 效应 以 及 他 们 的 交互 作用 ， 也 大 致 落 在 相同 的 区 间 。 
387 ”此 外 需要 注意 的 是 ， 尽 管 我 们 使 用 正 态 分 布 作为 残 差 sigma 和 随机 效应 的 标准 差 sd 设置 先 验 ， 但 由 于 
388 ”这 些 参数 不 能 小 于 0， 因 此 他 们 实际 对 应 的 先 验 分 布 是 截断 正 态 分 布 (truncated normal distribution) 。 
389 ”最 后 ， 随 机 效应 间 的 相关 性 设置 为 弱 信 息 先 验 prior(Ikj(2), class = cor), FL iki 为 LKI 相关 性 矩阵 
390 (LKJ-Correlation prior matrix, Lewandowski et al., 2009) 。 

= 391 为 了 检验 先 验 分 布 的 合理 性 ， 我 们 可 以 使 用 先 验 预测 检验 考查 仅 基于 先 验 信息 生成 的 因 变 量 〈 即 
= 392 LPP 的 波幅 ) 的 情况 。 进 行 先 验 预 测 检验 需要 对 先 验 分 布 进行 采样 〈sample) ， 即 在 模型 中 设 定 先 验 分 
393 dfi prior-prior 01 的 基础 上 加 入 sample_prior="only"， 通 过 该 设置 可 以 仅 从 先 验 分 布 中 进行 采样 (忽略 
394 ”观测 数据 的 似 然 值 信息 ) 。 其 余 参 数 的 设 定 和 我 们 在 分 析 数 据 时 设 定 相同 例如 model 3) , RARI 
395 ”如 下 : 


nj 


4 


396 | model ppc 01 «- brm( 


— 397 LPP ~ group * type + (1 + type | subj), 
rr 398 data = df simu, 
— 399 Chnana = 4, 

400 warmup = 1000, 

401 meee = 5000, 

402 (gnum = l, 

403 Coes = 4, 

404 prior = prior 01, 

405 sample prior = "only" 

406 ) 

407 通过 上 述 代码 ， 我 们 可 以 获得 16,000 41 ( (5000-1000) *4) 来 自 先 验 分 布 的 抽样 。 其 中 ， 每 一 组 


408 ”都 包含 模型 的 所 有 参数 ， 即 固定 截 距 ， 固 定 斜率 和 随机 效应 等 。 每 一 组 先 验 参 数 都 可 以 生成 一 套 新 的 

409 ”与 数据 集 (df_simu) 结构 相同 的 模拟 观测 数据 ( 即 因 变 量 ) 。 我 们 可 以 通过 考查 这 些 模拟 观测 数据 的 

410 ”合理 性 (比如 检查 每 一 套 模拟 数据 的 极 值 ) 去 判断 先 验 的 设 定 是 否 合适 。 例 如 在 一 个 以 反应 时 为 因 变 

411 ” 量 的 stroop 实 验 中 ， 如 果 那 些 由 先 验 分 布 生成 的 模拟 数据 集中 大 部 分 数据 集 的 最 大 值 都 超过 预期 (比如 
14 
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10 秒 ) ， 这 很 可 能 说 明 模型 某 些 参数 先 验 的 设 定 不 太 合理 《比如 截 距 或 标准 差 过 大 ) 。 在 当前 模拟 实 
验 中 ， 尽 管 我 们 无 法 根据 先前 研究 获取 精确 的 先 验 ， 但 是 可 以 利用 现 有 的 知识 ， 即 试 次 水 平 的 脑 电 事 
件 相关 电位 的 波幅 通常 在 一 定 的 范围 之 内 ， 来 确定 先 验 。 因 此 ， 我 们 计算 16,000 套 由 先 验 分 布 生成 的 
模拟 观测 数据 各 自 的 最 小 值 Cmin) 、 均 值 (mean) 和 最 大 值 Cmax) ， 并 通过 它们 的 范围 是 否 符合 我 
们 的 先 验 知识 来 判断 先 验 分 布 的 合理 1 

述 分 析 可 以 通过 brms 提供 的 pp_check() 函数 实现 。 以 下 代码 展示 了 prior2prior 01 的 先 验 预测 


p 


的 结果 : 

Pe checkimodel pre Ol, type = YStaic’, gue = "mn preii Tepadan) 
Pe check(model joe Ol, type — “Siecle, otat = Tmax", preii: ppd) 
pp check(model ppe Ol, types = stat", stat mean prefix = "ppd" 


T = min T = max T = mean 


@ T (prea) L1 T (Yprea) El T (ypred) 


-100 -75 -50 -25 0 25 0 40 80 -40 -20 0 20 40 


3 基于 先 验 prior 01 生成 的 16,000 套 预测 数据 (y(pred)〉 的 最 小 值 、 最 大 值 和 均值 的 分 布 


结果 显示 ， 基 于 prior 01 生成 的 每 一 套 模 拟 观 测 数据 的 最 小 值 大 部 分 落 在 [-75, 0]， 均 值 大 部 分 落 
在 [-25, 25]， 而 最 大 值 大 部 分 落 在 [0, 80]。 根 据 先 验 知识 ， 试 次 水 平 的 脑 电 波幅 通常 很 少 会 低 于 -50 (nV) 
或 高 于 50 (pV)〉〔 伪 迹 除 外 ) 。 因 此 ， 我 们 可 以 适当 地 调整 参数 的 先 验 分 布 以 符合 我 们 的 先 验 知识 ， 
即 减 小 参数 先 验 分 布 的 不 确定 性 。 

在 接 下 来 的 尝试 中 ， 我 们 将 固定 截 距 和 固定 斜率 的 先 验 设置 成 均值 为 0， 标准 差 为 5 的 正 态 分 布 ， 
并 进行 与 之 前 相同 的 先 验 预测 检验 : 


定义 先 验 分 布 
peior 02 <= el 
prior mMornel (i, BS), Class = mereso 7 
prior(normal(0, 5), class = p), 
prior(normal(0, 5), class = sigma), 
prior (Groves (0), 5») 7 Class = sc, 
alee (Oe (2). class = joi) 
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448 


450 
451 
452 
453 
454 
455 


456 


457 
458 


) 


model ppe 02 -= lenem 


WAS c» groa = cS r C se eye || eg» 
data = 


chains = 


warmup 


iter = 
thin = 


cores 


prior 


daf simu, 
4, 

= 1000, 
5000, 

1, 


= 4, 
= prio 07 


sample prior ond 


) 


Pe check imodel ppe (02. type Torat Sicelic minn aeii ppd) 


pp check (model 


poe 02, tyoe = tor sus = "wb", aeii = Vero) 


Po checki(model ppe 02, type = Torat", olat = Tmean!, prefix = ppa") 


T = min T = max 


E T (V prea) E T (Yprea) 


-80 -60 -40 -20 0 0 20 40 60 80 -20  -10 


图 4 基于 先 验 prior 02 生成 的 每 一 套 预 测 数据 (y(pred)〉 的 最 小 值 、 最 大 值 和 均值 的 分 布 


T = mean 


| T (Yprea) 


10 20 


经 过 同样 的 步 又， 我 们 可 以 获得 基于 先 验 prior_02 生成 的 16,000 套 模拟 观测 数据 Cy(pred)) 的 最 小 
值 、 均 值 和 最 大 值 的 分 布 〈 图 4) 。 结 果 显 示 模 拟 观测 数据 的 最 小 值 大 部 分 落 在 [-60, 0]， 均 值 大 部 分 落 
在 了 [-10, 10]， 最 大 值 大 部 分 落 在 [0, 60]。 与 prior_01 的 先 验 预测 结果 (图 3) 相 比 ，prior_02 预测 的 结 
果 更 多 落 在 了 [-50, 50] 内 ， 能 够 相对 更 合理 的 描述 我 们 的 先 验 知识 。 最 后 需要 注意 的 是 ， 确 定 合理 的 先 


验 分 布 通 党 


[J 


需要 重复 多 次 类 似 的 过 程 ， 且 并 不 是 先 验 分 布 的 信息 越 强 就 越 好 ， 


的 先 验 知识 。 
1.6 模型 拟 合 


在 确定 先 验 后 ， 我 们 可 以 开始 拟 合 模型 ， 该 模型 包括 所 有 可 能 的 随机 截 距 、 随 机 斜率 和 它们 之 间 
的 相关 ， 并 通过 prior=prior_02 为 模型 设 定 先前 确定 的 先 验 。 此 外 ， 我 们 设 定 sample prior ="yes", VA 
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m 
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到 
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459 ”此 保留 仅 依 靠 先 验 信息 获得 的 采样 〈 即 先 验 分 布 的 采样 ) 和 同时 依靠 先 验 和 数据 似 然 值 信息 获得 的 采 
460 “” 样 “ 即 后 验 分 布 的 采样 ) ， 这 两 种 采样 将 会 被 用 于 计算 贝 叶 斯 因子 〈 详 见 3.5) 。 有 具体 代码 如 下 : 
461 model 4 «- brm( 

462 LPR ~ group * type + (1 + type | subj), 

463 data = df simu, 

464 chains = 4, 

465 warmup = 1000, 

466 iter = 5000 

467 thin = 1, 

468 Cores. = 4, 

469 orior = prior 02, 

470 sample prior z "yes" 

471 ) 

472 summary (model 4) 

473 Group-Level Effects: 

474 ~subj (Number of levels: 80) 

475 Estimate Est.Error 1-95% CI u-95$ CI Rhat Bulk ESS Tail ESS 
476 sd(Intercept) DIG 0.18 1.85 2.54 1.00 ill PAHO 
477 sd (type2M1) 1. 0.16 155 2:15 1,5 0) 2626 5004 
478 cor (Intercept, type2M1) Open Oi 0.10 (00895: R00 2082 3882 
479 

480 Population-Level Effects: 

481 Estimate Est.Error 1-95% CI u-95$ CI Rhat Bulk ESS Tail ESS 
482 Intercept 0.67 0.24 0.18 Lod LO 656 1246 
483 group2M1 0.27 0.49 -0.70 iL.2HL 1.00 610 1141 
484 type2M1 6.48 0.21 6.07 6.90 1.00 1569 3145 
485 group2M1 :type2M1 0.00 0.43 -0.83 O87 1.010 1247 2556 
486 完成 模型 拟 合 后 ， 我 们 可 以 借助 后 验 预测 检验 Cposterior predictive checking) 检查 模型 对 实际 观测 


487 ”数据 的 “描述 充分 性 ” (“descriptive adequacy", Gelman et al., 2013) 。 与 先 验 预测 检验 (3.3 小 节 ) 
488 ”相似 ， 后 验 预 测 检验 也 可 以 根据 参数 值 生 成 对 应 的 模拟 数据 ， 区 别 在 于 ， 后 验 预 测 检验 模拟 过 程 使 用 
489 ”的 参数 来 自 参 数 后 验 分 布 。 我 们 同样 可 以 使 用 brms 的 pp. check. O 函数 来 绘制 后 验 预测 检验 的 结果 : 


490 后 验 预测 检验 
491 pp check(model 4, type = "stat grouped", group = "type") 
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501 
502 
503 
504 
505 
506 


507 
508 
509 
510 


netural positive 


T = mean 


TOrep) 
| Tv) 
2.8 2 2.6 25 2.4 23 3-7 3.8 3.9 4.0 4.1 
图 5 后 验 预测 分 布 图 〈 黑 色 线 条 T O) 为 观测 数据 的 均值 ， 浅 蓝 色 部 分 T Cyrep) 为 后 验 预测 数据 的 
均值 的 分 布 ) 


图 5 展示 了 观测 数据 的 均值 (黑色 线条 为 中 性 图 片 和 积极 图 片 类 型 LPP 的 均值 ) 和 依据 模型 生成 
的 预测 数据 〈 即 后 验 预 测 分 布 的 均值 的 分 布 ( 浅 蓝 色 为 模型 预测 的 数据 均值 )。 如 图 所 示 ， 大 部 分 
后 验 预 测 数 据 的 均值 与 观测 数据 的 均值 接近 ， 说 明 我 们 构建 的 模型 较 好 地 描述 了 观测 数据 。 如 果 观 测 
数据 的 统计 量 和 模拟 生成 的 预测 数据 的 统计 量 间 存在 较 大 的 差异 ， 研 究 者 则 需要 慎重 考虑 构建 的 模型 
是 否 忽 略 了 某 些 重要 因素 ， 如 未 使 用 合适 的 残 差分 布 或 链接 函数 等 (Schad et al., 2021) 。 


1.7 统计 推断 : 贝 叶 斯 因子 


在 实际 应 用 中 ， 研 究 者 通常 感 兴趣 的 是 实验 条 件 之 间 是 否 存在 差异 ， 例 如 本 研究 中 的 组 别 〈 组 间 
因素 ) 和 图 片 类 型 〈 被 试 内 因素 ) 是否 会 对 LPP 产生 影响 。 在 贝 叶 斯 分 析 框 架 下 ， 我 们 可 以 基于 后 验 
7 布 进行 贝 叶 斯 推断 〈Bayesian inference) 和 假设 检验 。 进 行 假设 检验 的 常见 的 方式 之 一 是 计算 贝 叶 斯 
T (Bayes factor) 。 贝 叶 斯 因子 可 以 量化 基于 不 同 的 假设 或 模型 (例如 零 假设 和 备 择 假 设 ) 观测 到 
当前 数据 的 似 然 比 值 (Rouder et al., 2018) ， 研 究 者 可 以 根据 其 数值 大 小 推断 观测 到 的 数据 更 可 能 支 
持 哪 种 假设 或 模型 。 一 种 流行 的 计算 贝 叶 斯 因子 的 方法 是 Savage-Dickey density ratio， 该 方法 通过 计算 
在 参数 取 值 为 0 时 两 个 模型 的 似 然 值 的 比值 来 估算 贝 叶 斯 因子 ， 详 见 Wagenmakers 5$ (2010) 。 通 过 
brms 提供 的 hypothesis() 函数 可 以 实现 该 贝 叶 斯 因子 的 计算 。 

首先 ， 利 用 model 4 检验 图 片 类 型 是 否 会 对 LPP 产生 影响 : 


H 


IK 


组 内 比较 

result <- hypothesis (model 4, type2Ml=0°) 
resultShypothesisSEvid.Ratio 查看 贝 叶 斯 因子 BF 01 
[1] 1.629488e-15 
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511 RB. "epe2M1-0" 表示 图 片 类 型 的 零 假 设 ， 即 LPP 在 积极 图 片 与 中 性 图 片上 的 差异 为 0。 
512  hypothesis$Evid.Ratio 描述 了 贝 叶 斯 因子 BFoi， 表 示 基 于 零 假 设 CHO) 观测 到 当前 数据 的 似 然 与 基于 备 
513 FRR HD 观测 到 当前 数据 的 似 然 的 比值 。 为 了 依据 BFo 进行 统计 推断 ， 研 究 者 通常 需要 预先 设 定 
514 ，” 贝 叶 斯 因子 的 判断 标准 〈 胡 传 鹏 等 ，2018) 。 根 据 Lee and Wagenmakers' Scale 的 贝 叶 斯 因子 判定 标准 
515 (Lee & Wagenmakers, 2014)， 可 以 将 BFo1 支 持 零 假设 的 证 据 强 调 分 为 十 类 ， 如 表 2。 上 述 结果 显示 ， 
516 BFo = 1.63*10-5， 远 远 小 于 1/1100， 说 明 存 在 极 强 的 证 据 支 持 图 片 类 型 的 效应 存在 的 备 择 假设 ， 因 
517 He ERAT SEW LPP 的 波幅 在 不 同 图 片 类 型 之 间 存 在 差异 。 


518 表 2 贝 叶 斯 因子 决策 标准 
贝 叶 斯 因子 ，BFoi 解释 标准 
> 100 极 强 的 证 据 支持 A 
30 ~ 100 非常 强 的 证 据 支持 Ab 
10 ~ 30 较 强 的 证 据 支 持 Ho 
3-10 中 等 程度 的 证 据 支 持 Ho 
1-3 较 弱 的 证 据 支持 万 
1 没有 证 据 
1/3~1 较 弱 的 证 据 支 持 H 
1/10 ~ 1/3 中 等 程度 的 证 据 支 持 A 
1/30~ 1/10 较 强 的 证 据 支 持 H 
1/100 ~ 1/30 非常 强 的 证 据 支 持 A 
< 1/100 极 强 的 证 据 支持 A 


ik: 该 表 改 编 自 胡 传 鹏 等 ， 〈2018) ， 源 引用 于 (Lee & Wagenmakers, 2014). 


接 下 来 ， 我 们 检验 LPP 在 不 同 组 别 间 的 差异 是 否 为 0: 


520 组 间 比 较 

521 result «- hypothesis (model 4, "group2M1=0") 

522 | result$hypothesis$Evid.Ratio # 查看 贝 叶 斯 因子 BF 01 

523 [1] 8.865514 

524 "group2M1=0" 表示 组 别 (group) 的 零 假设 ， 即 抑郁 组 与 对 照 组 被 试 在 LPP 上 的 表现 差异 为 0。 结 
525 ” 果 显 示 ，BFo01= 8.90 > 3， 这 表明 存在 中 等 强度 的 证 据 文 持 组 别 的 零 假 设 ， 从 而 我 们 推断 组 别 之 间 的 
526 ”LPP 波幅 不 存在 差异 。 

527 比 外 ， 我 们 还 可 以 检验 交互 作用 是 否 为 0: 


^ 


D 


c— 


528 result < hypothesis (model 4, "group2M1:type2M1=0") 
529 | result$hypothesisS$Evid.Ratio 查看 贝 叶 斯 因子 BE 01 
530 [1] 11.74594 
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531 "group2M I:type2M 120" 表示 组 别 〈group) 和 图 片 类 型 〈type) 交互 作用 的 零 假 设 ， 即 抑郁 组 中 积 
532 ” 极 图 片 和 中 性 图 片 LPP 波幅 差异 与 对 照 组 中 积极 图 片 和 中 性 图 片 LPP 波幅 差异 的 差异 〈 即 差 的 差 ) 为 
533 ”0。 结 果 显示 ，BFoi = 11.75 > 10， 这 表明 存在 较 强 的 证 据 支 持 不 存在 组 别 和 图 片 类 型 的 交互 作用 。 

534 最 后 ， 我 们 可 以 根据 mode/_4 参 数 分 析 的 结果 《固定 效应 ) 和 贝 叶 斯 因子 分 析 的 结果 报告 : “ 贝 叶 
535 ”斯 混合 效应 模型 的 结果 显示 ， 存 在 极 强 的 证 据 表明 ， 积 极 图 片 诱发 的 LPP 波幅 高 于 中 性 图 片 ， 
536 Bry ey = 648. BFo = 1.63*10-， 同 时， 存在 较 强 的 证 据 表 明 ， 两 组 的 LPP 波幅 不 存在 显著 差 
537. Æ> Bg, = 0.27, BFo = 8.90; 且 存 在 中 等 的 证 据 表明 图 片 类 型 和 组 别 不 存在 交互 作用 ， 


539 
= 540 4 小 结 
541 本 文 首先 介绍 了 贝 叶 斯 混合 效应 模型 在 处 理 数据 层级 结构 和 提供 更 直观 的 统计 结果 等 方面 的 独特 
542 ”优势 ， 并 概述 了 其 基本 原理 。 更 重要 的 是 ， 本 文 结合 模拟 数据 和 代码 示例 ， 介 绍 了 固定 效应 和 随机 效 
543 M, 如 何 构 建 贝 叶 斯 混合 效应 模型 ， 如 何 利 用 先 验 预测 检验 设置 合理 的 先 验 分 布 ， 以 及 如 何 借 助 贝 叶 


544 ”斯 因子 进行 统计 推断 。 
545 本 文 主要 关注 了 贝 叶 斯 线性 混合 效应 模型 ， 它 是 其 他 扩展 模型 的 基础 。 一 类 常用 的 扩展 模型 是 贝 
546 ” 叶 斯 广义 线性 混合 效应 模型 (Bayesian Generalized Linear Mixed-effects Models) ， 它 能 够 更 好 地 处 理 心 
547 ”理学 实验 中 其 他 常见 的 因 变 量 ， 比 如 二 元 选择 、 反 应 时 、 阅 读 时 间 、 李 克 特 评分 等 (Dixon，2008; 
= 548 Rousselet & Wilcox, 2020) 。 具 体 来 说 ， 研 究 者 可 以 在 贝 叶 斯 广义 线性 混合 效应 模型 中 为 因 变 量 设 定 
549 ”更 合理 的 残 差分 布 (residual distribution) 和 链接 函数 Clink function) ， 进 而 获得 更 准确 的 估计 结果 
550 (Vuorre, 2017) 。 例 如 ， 对 于 二 项 选择 《如 正确 标记 为 1， 错 误 为 0) 的 因 变 量 ，prz() 函 数 可 以 通过 
“ey 551 ”参数 family= bernoulli( logit") BBA RED Hi ABA (Bernoulli) 分 布 且 使 用 logit 链接 函数 
552 (Bürkner, 2017) 。 再 比如 对 于 反应 时 ， 研 究 者 可 以 通过 family=“lognormal” 为 其 设置 log 转换 
553 (Wagenmakers & Brown, 2007) 。 此 外 ， 贝 叶 斯 分 层 模型 还 可 以 应 用 于 复杂 的 认 知 模型 ， 比 如 信号 检 
554 ” 测 论 、 漂 移 扩散 模型 、 强 化 学 习 模 型 、 多 项 式 加 工 树 模型 等 (Ahn et al., 2017; Schad et al., 2020; 

555 Tso etal., 2021) 。 这 些 分 析 可 以 通过 及 语言 的 工具 包 《〈 如 hBayesDM) 、Stan 和 JAGS 等 其 他 工具 来 
556 ”完成 (Ahn etal.，2017; Kruschke, 2014) 。 总 的 来 说 ， 贝 叶 斯 混合 效应 模型 凭借 其 强大 的 灵活 性 ， 能 
557 ” 够 很 好 地 适用 于 多 样 的 心理 学 实验 研究 中 。 

558 贝 叶 斯 混合 效应 模型 的 诸多 优点 使 其 逐渐 流行 于 心理 学 研究 的 数据 分 析 之 中 (Bono et al., 2021) o 
559 ”但 不 可 否认 的 是 ， 研 究 者 在 实践 中 使 用 这 种 分 析 方 法 时 仍 会 面临 一 些 困难 。 比 如 ， 在 初学 贝 叶 斯 混合 
560 ”效应 模型 时 ， 研 究 者 可 能 并 不 清楚 如 何 设置 合理 的 先 验 ， 进 而 会 采用 工具 包 提 供 的 默认 先 验 。 需 要 注 
561 ” 意 的 是 ， 这 些 默 认 先 验 并 不 一 定 适用 于 所 有 的 研究 ， 而 使 用 不 合适 的 先 验 可 能 造成 模型 难以 收敛 等 潜 


NI 


nin 
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在 问题 CVeenmanetal, 2022) 。 如 3.5 小 节 所 介绍 ， 研 究 者 可 以 根据 以 往 的 研究 和 自己 的 知识 自 定义 
先 验 ， 并 且 可 以 借助 先 验 预 测 检验 来 审查 这 些 先 验 的 合理 性 。 其 次 ， 当 使 用 贝 叶 斯 因子 进行 假设 检验 
时 ， 研 究 者 一 般 无 法 通过 单个 模型 获得 所 有 感 兴趣 的 效应 。 例 如 wmodel_4 结 果 只 包含 了 图 片 类 型 和 组 别 
的 主 效应 ， 以 及 他 们 的 交互 作用 。 相 应 地 ， 我 们 也 只 能 计算 这 三 个 效应 的 贝 叶 斯 因子 。 如 果 研 究 者 同 
时 对 其 他 效应 《如 简单 效应 ) 感 兴趣 ， 则 需要 构建 新 的 模型 并 设置 不 同 的 对 比 编码 (contrast coding? 
来 检验 不 同 的 假设 (Schad et al., 2020) 。 最 后 ， 拟 合 贝 叶 斯 混合 效应 模型 相对 更 加 耗 时 。 随 着 数据 量 
的 变 大 、 模 型 复杂 程度 的 提升 、 以 及 采样 迭代 数量 的 增长 ， 贝 叶 斯 混合 效应 模型 的 拟 合 时 间 也 会 相应 
地 旺 指数 性 增长 。 对 此 ， 研 究 者 可 以 通过 设置 合理 的 先 验 和 使 用 高 性 能 的 计算 机 提升 模型 的 拟 合 速 度 。 

本 文 借助 心理 学 研究 示例 ， 通 过 具体 代码 向 读者 展示 了 如 何 使 用 贝 叶 斯 混合 效应 模型 进行 数据 分 
析 。 尽 管 我 们 尝试 涵盖 尽 可 能 多 的 内 容 ， 但 我 们 介绍 的 也 只 是 贝 叶 斯 混合 效应 模型 的 冰山 一 角 。 随 着 
开放 科学 (Open Science) FE CHRISSE, 2016; Nosek, 2019; Open Science Collaboration, 2015; 
Jinetal,2023) ， 越 来 越 多 的 文章 公开 其 数据 和 代码 ， 这 无 疑 为 研究 者 提供 了 更 多 结合 具体 实例 的 贝 叶 
斯 混合 效应 模型 的 应 用 教程 。 此 外 ， 我 们 也 鼓励 希望 对 该 方法 有 更 加 深入 和 全 面 了 解 的 读者 阅读 贝 叶 
斯 分 析 相 关 的 优秀 书籍 (Gelman etal., 2013; Kruschke, 2014; Lambert, 2018; McElreath, 2020) . 
希望 研究 者 可 以 对 叶 斯 混合 效应 模型 有 更 加 深入 的 了 解 ， 能 够 广泛 地 将 其 应 用 于 多 样 的 心理 学 研究 之 
中 。 
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Abstract: Compared to the traditional statistical methods, Bayesian linear mixed-effects modeling 
(BLMM ) has a great number of advantages in dealing with the hierarchical structures underlying 
datasets and providing more intuitive statistical results. These advantages together popularize 
BLMM in psychological and other field research. However, there is still a lack of tutorials on the 
practical applications of BLMM in psychology studies in Chinese. Therefore, we first briefly 
introduced the basic concepts and rationales of BLMM. Then we employed a simulated dataset to 
demonstrate how to understand fixed effects and random effects, and how to use the popular brms 
R package to specify models for BLMM based on the experimental design. We additionally 
covered the procedure of pre-specifying priors with prior predictive checks, and the steps of 
performing hypothesis testing using the Bayes Factor. BLMM, with its extensions such as 
Generalized BLMM, has great flexibility and capability, they can and should be applied in various 
psychology research. 


Key words: Bayesian, linear mixed-effects modeling, hierarchical models, Bayes Factor, brms 
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